智能论文笔记

INTRPRT: A Systematic Review of and Guidelines for Designing and Validating Transparent AI in Medical Image Analysis

Haomin Chen , Catalina Gomez , Chien-Ming Huang , Mathias Unberath

分类：计算机视觉 | 机器学习

2021-12-21

机器学习透明度（ML），试图揭示复杂模型的工作机制。透明ML承诺推进人为因素在目标用户中以人为本的人体目标的工程目标。从以人为本的设计视角，透明度不是ML模型的属性，而是一种能力，即算法与用户之间的关系;因此，与用户的迭代原型和评估对于获得提供透明度的充足解决方案至关重要。然而，由于有限的可用性和最终用户，遵循了医疗保健和医学图像分析的人以人为本的设计原则是具有挑战性的。为了调查医学图像分析中透明ML的状态，我们对文献进行了系统审查。我们的评论在医学图像分析应用程序的透明ML的设计和验证方面揭示了多种严重的缺点。我们发现，大多数研究到达迄今为止透明度作为模型本身的属性，类似于任务性能，而不考虑既未开发也不考虑最终用户也不考虑评估。此外，缺乏用户研究以及透明度声明的偶发验证将当代研究透明ML的医学图像分析有可能对用户难以理解的风险，因此临床无关紧要。为了缓解即将到来的研究中的这些缺点，同时承认人以人为中心设计在医疗保健中的挑战，我们介绍了用于医学图像分析中的透明ML系统的系统设计指令。 Intrult指南建议形成的用户研究作为透明模型设计的第一步，以了解用户需求和域要求。在此过程之后，会产生支持设计选择的证据，最终增加了算法提供透明度的可能性。

translated by 谷歌翻译

A Machine Learning Case Study for AI-empowered echocardiography of Intensive Care Unit Patients in low- and middle-income countries

Xochicale Miguel , Thwaites Louise , Yacoub Sophie , Pisani Luigi , Tran Huy Nhat Phung , Kerdegari Hamideh , King Andrew , Gomez Alberto

分类：机器学习

2022-12-30

We present a Machine Learning (ML) study case to illustrate the challenges of clinical translation for a real-time AI-empowered echocardiography system with data of ICU patients in LMICs. Such ML case study includes data preparation, curation and labelling from 2D Ultrasound videos of 31 ICU patients in LMICs and model selection, validation and deployment of three thinner neural networks to classify apical four-chamber view. Results of the ML heuristics showed the promising implementation, validation and application of thinner networks to classify 4CV with limited datasets. We conclude this work mentioning the need for (a) datasets to improve diversity of demographics, diseases, and (b) the need of further investigations of thinner models to be run and implemented in low-cost hardware to be clinically translated in the ICU in LMICs. The code and other resources to reproduce this work are available at https://github.com/vital-ultrasound/ai-assisted-echocardiography-for-low-resource-countries.

translated by 谷歌翻译

edBB-Demo: Biometrics and Behavior Analysis for Online Educational Platforms

Roberto Daza , Aythami Morales , Ruben Tolosana , Luis F. Gomez , Julian Fierrez , Javier Ortega-Garcia

分类：计算机视觉

2022-11-16

We present edBB-Demo, a demonstrator of an AI-powered research platform for student monitoring in remote education. The edBB platform aims to study the challenges associated to user recognition and behavior understanding in digital platforms. This platform has been developed for data collection, acquiring signals from a variety of sensors including keyboard, mouse, webcam, microphone, smartwatch, and an Electroencephalography band. The information captured from the sensors during the student sessions is modelled in a multimodal learning framework. The demonstrator includes: i) Biometric user authentication in an unsupervised environment; ii) Human action recognition based on remote video analysis; iii) Heart rate estimation from webcam video; and iv) Attention level estimation from facial expression analysis.

translated by 谷歌翻译

Exploring Low Rank Training of Deep Neural Networks

Siddhartha Rao Kamalakara , Acyr Locatelli , Bharat Venkitesh , Jimmy Ba , Yarin Gal , Aidan N. Gomez

分类：机器学习 | (统计)机器学习

2022-09-27

培训低级的深层神经网络，即使用分解层，特别是社区感兴趣的：它在记忆消耗和训练时间方面提供了对未分离培训的效率。先前的工作集中在预训练的网络的低级近似值和低级空间中的培训中，并提供了其他目标，为所选实践提供了各种临时解释。我们分析了在实践中运作良好的技术，并通过对诸如GPT2之类的模型进行广泛的消融，我们提供了证据表明该领域的共同信念，这暗示着令人兴奋的研究机会仍然需要回答。

translated by 谷歌翻译

Show, Interpret and Tell: Entity-aware Contextualised Image Captioning in Wikipedia

Khanh Nguyen , Ali Furkan Biten , Andres Mafla , Lluis Gomez , Dimosthenis Karatzas

分类：计算机视觉

2022-09-21

人类利用先验知识来描述图像，并能够使其解释适应特定的上下文信息，即使在上下文信息和图像不匹配时，也可以在发明合理的解释的范围内。在这项工作中，我们提出了通过整合上下文知识来字幕Wikipedia图像的新颖任务。具体而言，我们制作的模型共同推理了Wikipedia文章，Wikimedia图像及其相关描述以产生上下文化的标题。特别是，可以使用类似的Wikimedia图像来说明不同的文章，并且所产生的标题需要适应特定的上下文，因此使我们能够探索模型的限制以调整标题为不同的上下文信息。该领域中的一个特殊挑战性的任务是处理量不多的单词和命名实体。为了解决这个问题，我们提出了一个预训练目标，掩盖了命名实体建模（MNEM），并表明与基线模型相比，此借口任务可以改善。此外，我们验证了Wikipedia中使用MNEM目标预先训练的模型可以很好地推广到新闻字幕数据集。此外，我们根据字幕任务的难度定义了两种不同的测试拆分。我们提供有关每种方式的作用和重要性的见解，并突出我们模型的局限性。接受时，代码，模型和数据拆分可公开可用。

translated by 谷歌翻译

Documenting use cases in the affective computing domain using Unified Modeling Language

Isabelle Hupont , Emilia Gomez

分类：人工智能

2022-09-19

对AI的道德影响和值得信赖系统的设计的研究需要分析使用AI系统的方案，这与“用例”的软件工程概念和“预期目的”法律术语有关。但是，没有用于涵盖使用，范围，功能要求和AI系统风险的用例文档的标准方法。在这项工作中，我们为AI用例提出了一种新颖的文档方法，特别关注情感计算领域。我们的方法基于对研究文献中记录的用例信息需求的评估以及最近提议的AI欧洲监管框架。通过此评估，我们采用并调整了统一的建模语言（UML），在过去的二十年中，这主要由软件工程师使用。然后，每个用例都由UML图和一个结构化表表示，我们提供了一组示例，说明了其在几种情感计算方案中的应用。

translated by 谷歌翻译

MUST-VQA: MUltilingual Scene-text VQA

Emanuele Vivoli , Ali Furkan Biten , Andres Mafla , Dimosthenis Karatzas , Lluis Gomez

分类：计算机视觉

2022-09-14

在本文中，我们介绍了一个多语言场景文本视觉问题的框架，以零拍的方式处理新语言。具体来说，我们考虑场景文本视觉质量回答（STVQA）的任务，其中可以用不同的语言提出问题，并且不一定与场景文本语言保持一致。因此，我们首先引入了自然的步骤，朝着更广泛的版本的STVQA：MUST-VQA介绍。考虑到这一点，我们讨论了在受约束设置的两个评估方案，即IID和零照片，我们证明这些模型可以在零拍设置的标准杆上执行。我们进一步提供了广泛的实验，并显示了将多语言模型调整为STVQA任务的有效性。

translated by 谷歌翻译

Can you recommend content to creatives instead of final consumers? A RecSys based on user's preferred visual styles

Raul Gomez Bruballa , Lauren Burnham-King , Alessandra Sala

分类：计算机视觉 | 机器学习

2022-08-23

由于用户不是最终的内容消费者，因此在内容市场中提供有意义的建议是具有挑战性的。取而代之的是，大多数用户是创意者的兴趣，与他们从事的项目相关，迅速而突然地改变。为了解决向内容创建者推荐图像的具有挑战性的任务，我们设计了一个recsys，以学习视觉样式的偏好，横向用户工作的项目的语义。我们分析了任务的挑战与语义驱动的基于内容的建议，提出评估设置并解释其在全球图像市场中的应用。该技术报告是ACM Recsys '22介绍的论文“学习用户在图像市场中的首选视觉样式”的扩展。

translated by 谷歌翻译

The Saddle-Point Accountant for Differential Privacy

Wael Alghamdi , Shahab Asoodeh , Flavio P. Calmon , Juan Felipe Gomez , Oliver Kosut , Lalitha Sankar , Fei Wei

分类：机器学习

2022-08-20

我们引入了一个新的差异隐私（DP）会计师，称为鞍点会计师（SPA）。SPA以准确而快速的方式近似保证DP机制的组成。我们的方法是受鞍点法的启发，这是一种统计中无处不在的数值技术。通过为SPA提供的近似误差，我们通过得出上限和下限来证明性能的严格保证。水疗中心的关键是与中心极限定理的大型探空方法的组合，我们通过指数倾斜与DP机制相对应的隐私损失随机变量来得出。水疗中心的一个关键优点是，它可以在$ n $折叠机制的$ n $折叠组成下持续运行。数值实验表明，水疗中心的准确性与更快的运行时的最新会计方法相当。

translated by 谷歌翻译

Where is VALDO? VAscular Lesions Detection and segmentatiOn challenge at MICCAI 2021

Carole H. Sudre , Kimberlin Van Wijnen , Florian Dubost , Hieab Adams , David Atkinson , Frederik Barkhof , Mahlet A. Birhanu , Esther E. Bron , Robin Camarasa , Nish Chaturvedi

分类：计算机视觉 | 人工智能

2022-08-15

脑小血管疾病的成像标记提供了有关脑部健康的宝贵信息，但是它们的手动评估既耗时又受到实质性内部和间际变异性的阻碍。自动化评级可能受益于生物医学研究以及临床评估，但是现有算法的诊断可靠性尚不清楚。在这里，我们介绍了\ textIt {血管病变检测和分割}（\ textit {v textit {where valdo？}）挑战，该挑战是在国际医学图像计算和计算机辅助干预措施（MICCAI）的卫星事件中运行的挑战（MICCAI） 2021.这一挑战旨在促进大脑小血管疾病的小而稀疏成像标记的自动检测和分割方法的开发，即周围空间扩大（EPVS）（任务1），脑微粒（任务2）和预先塑造的鞋类血管起源（任务3），同时利用弱和嘈杂的标签。总体而言，有12个团队参与了针对一个或多个任务的解决方案的挑战（任务1 -EPVS 4，任务2 -Microbleeds的9个，任务3 -lacunes的6个）。多方数据都用于培训和评估。结果表明，整个团队和跨任务的性能都有很大的差异，对于任务1- EPV和任务2-微型微型且对任务3 -lacunes尚无实际的结果，其结果尤其有望。它还强调了可能阻止个人级别使用的情况的性能不一致，同时仍证明在人群层面上有用。

translated by 谷歌翻译